查看原文
其他

PNAS-2018-多年多点5千样本鉴定玉米根际可遗传微生物

宏基因组 宏基因组 2019-07-10

由Ruth E. Ley通讯,Edward S. Buckler和Jeffery L. Dangl参与,编辑则为本领域第一大牛Jeffery I. Gordon

本文的结果已经相关文章讲解的非常详细了,详见下文:

今天我们再从方法学角度带大家看一下此文。

摘要

在重要农作物中,不同基因型的影响植物根系定殖土壤微生物的关联仍然不确定。本研究基于27个玉米自交系,在三个地点五年的纵向(多年跟踪)研究,鉴定了微生物组与基因型可重复的关联。分析4866个样品,鉴定了143个OTUs相对丰度与基因型相关联,其中包括5/7的核心OTUs。植物遗传效应在年龄层面影响大,与群体的地块无关,但微生物组对受气候影响。季节样式显示植物根系微生物组是本地发展、随植物生长变化,响应天气事件的。此外,一些物种类群与宿主基因型相关。如果存在有益功能,微生物可作为育种的候选性状。

重要性

本文基于大规模田间玉米根际微生物纵向队列研究,发现物种相对丰度的差异可以被玉米遗传差异解释,仅次于不同地点、年龄和天气影响。如果可遗传的物种存在有益相关性状,可能在育种中有潜在应用价值。

图1. 环境与年龄根际微生物群落结构

PCoA非权重(A/B)和权重(C/D)UniFrac距离分析玉米根际和土壤样品。分别按时间和地点着色。

图2. 2010年田间个体广义遗传力

100个广义遗传力(H2)最高的OTUs,红色代表显著性P<0.001

鉴定2010年可遗传OTUs

为了估计植物遗传背景对OTUs丰度变异的影响,在控制环境因子的条件下,我们计算在80%样品中存在的792个OTUs的广义遗传力。鉴定了143个OTUs显著存在遗传力(对照为5000次排序P<0.001)

整理来说,这些OTUs的广义遗传力是相对很低的,只有0.15 - 0.25 (范围是0-1,1代表表型完全由基因型决定,如籽粒颜色)。表明环境因子对OTUs的相对丰度影响极大,正如我们之前预期的。同时发现这143个OTUs与92个组间差异OTUs存在共有(组间差异导致基因型差异相关OTUs是同一个原因)。

将系统发育树上标注这些可遗传图的OTUs(图3)。可遗传OTUs具有多样性。其中5/7的核心OTUs(Agrobacterium, Devosia, both Comamonadaceae, and the Sinobacteraceae OTUs)是可遗传的。Alpha, Beta, Delta, and Gammaproteobacteria包括了大多数可遗传的OTUs,除了Pseudomonas属的一个OTU分类为Pseudomonas viridiflava。只有8个可遗传OTUs无法比对Greengene,表明大多数可遗传的OTUs是以前观察到的。遗传力>0.2的OTUs一般可以科水平分类,许多可分类至属和种级别。

可遗传的OTUs的遗传力要低于传统的农艺性状,如产量通常为0.3,开花时间可达0.9或更高,而OTUs在0.15-0.25间。然而,植物基因型对物种相对丰度有明显的效应。植物基因型对微生物表型的选择作用,这些可遗传的种属功能和进化上的限制可以为宿主服务。

图3. 可遗传OTUs进化关系

展示在80%根际样本品中存在的OTUs。可遗传OTUs分枝标为红色。门水平着外圈背景色。树基于Greengene中相似部分序列的16S全长树。

材料与方法

文章分析代码 https://github.com/wallacelab/ley_rhizosphere_2017

概述

2010年,我们种植NAM群体在纽约州、伊利诺斯州、和密苏里州。并于开花时间取样,加上非种植土共收集了4866个样品。采用MiSeq测序16S的V4区,共获得627,000,000条序列。在2015年纽约同一地点重复了部分实验,获得45个根际样品,处理同2010年方法。使用QIIME软件包进行Beta多样性分析和Adonis检统计验、核心微生物组鉴定和alpha多样性分析。使用混合模型R包lme4进行差异丰度分析、alpha多样性显著性检验、微生物组对天气的响应和可遗传性等分析。其它分析细节见补充材料方法部分。

以下内容为补充材料方法部分的翻译

玉米根际土收集和准备

玉米自交品种包括: B73, B97, CML103, CML228, CML247, CML277, CML322, CML333, CML52, CML69, Hp301, Il14H, Ki11, Ki3, Ky21, M162W, M37W, Mo17, Mo18W, MS71, NC350, NC358, Oh43, Oh7B, P39, Tx303和Tzi8。在2010年的种植、处理、收集(12周)和DNA提取见之前Peiffer发表文章中的描述。

在纽约州、兰辛和奥罗拉的根际样品收集于1-15、20周。伊萨卡于2-15、20周取样。Illinosi的Urbana、Missouri的Columbia于12周取样。取样是有破坏性的,每个样代表一个独立的植物。收集每个植株根低部5cm和粘附的土壤颗粒,干冰运输并储存于-80直至处理。非种植土取自行间的10、15和20周。共4866个样本。使用MoBio Powersoil DNA提取试剂盒2010年进行提取。使用V4区引物于2012-2013年进行扩增。引物和和barcode间有0-3bp的空白,如Trebalay描述的方法。样品分53批在美国能源部的联合基因组研究院(JGI)的MiSeq平台测序。

为验证研究的可重复性,选择其中5个自交系(B73, CML277, HP301, IL14H和Mo17)在纽约的Aurora于2015年种植,4-12周取样,方法同2010年。

16S扩增子处理和分析

2010年的数据使用QIIME 1.8开发版extract_reads_from_interleaved_file.py处理JGI的交错(interleaved,双端 文件保存于同一文件1212的格式)格式。QIIME1.9.0用于下游分析。双端序列合并使用fastq-join,并进行样品拆分和质控。双端可合并的序列有627,638,736条,通过 split_library_fastq.py质控后剩余567,013,569条。引物去除使用自编写脚本(https://gist.github.com/walterst/ab88ae59a8900a2fa2da) 。2015年数据采用fastq-join和QIIME处理。所有序列采用open-reference OTU 97%相似度聚类,并选择中心点作为代表序列,数据库采用Greengene 13.8版本。OTU分类为线粒体、叶绿体或小于10条序列补移除。此时样品4858个,剩余453,674,044序列和45,954个OTU。滤除样本量小于10000条序列的样品,再物种组成图绘制,绘制属水平柱状图使用R 3.3.2,tidyr 0.6.0, ggplot2和dyplr 0.5.0,以及QIIME  summarize_taxa_through_plots.py 脚本。核心OTU检测使用compute_core_microbiome.py ,要求样品至少10000条序列。

Beta多样性和Adonis检验

R包Adonis检验,先将OTU表抽样至10000条,再计算非权重和权重的Unifrac距离矩阵,并将生长时间和地点作为因子统计差异。beta_diversity_through_plots.py 命令基于抽样10000条的样品绘制三维PCoA图和Adonis检验。

基因型与Beta多样性

在Hapmap2中查询NAM祖先并制作NAM亲源关系,过滤在至少10个祖先中出现的点。使用TASSEL产生遗传距离矩阵。使用beta距离矩阵和kinship矩阵计算R2。

差异丰度OTUs

采用混合线性模型统计玉米不同组和自交系间差异OTUs。OTUs没有在80%的样品中出现则使用QIIME的filter_otus_from_otu_table.py进行过滤。显著性检验使用R语言的lme4包、lmerTest2.0-33、lsmeans2.25-5、vegan2.4-2、和MuMIn1.15.6。
其中2010年的模型为:

lme4::lmer(OTU_abundance ~ maize_type + maize_age + standardized_counts + (1|environment))

2015年模型:

lm(OTU_abundance ~ maize_type + maize_age + standardized_counts)

OTU_abundance是立方根转换的count数值。maize_type是玉米的主要亚群(热带、硬杆等),或属于特定的自交系(IL14H, Mo17等),maize_age是样品生长的周数,standardized_counts是标准化的每个样品reads count,environment是取样地点。

选择OTU丰度的立方根转换,是因为在大多数情况下可获得线性残基的q-q图。OTU丰度转换采用vegan的standardize功能。比较采用lsmeans结合Tukey方式校正。

lsmeans::lsmeans(model, pairwise ~ maize_type, mode = "kenward-roger")

由于样本量很大,修改默认pbkrtest.limit参数3000为10000 (pbkrtest.limit = 10000)。结果P-value值采用Bonferroni检验2010年的792个OTUs,2015年的2557个OTUs(45个样本量太少导致80%样本中出现OTUs数量比较多)。

Alpha多样性

进化多样性(PD)、Shannon、Observed OTUs计算基于抽样10000条序列的OTUs表,并重复10次。模型和显著性检验与OTU丰度检验相同,但数据并不进行立方根转换。

微生物对气候的影响

为评估天气对根际微生物组的影响,我们获得2010、2015年气候数据(降雨和气温),使用混和线性模型确定那个物种的相对丰度与降雨和温度相关。
降雨量1、2、3天与OTU变化趋势相关。降雨量和空气温度数据来自国家环境信息中心(https://www.ncdc.noaa.gov/)。使用与实验站最近的气象站的温度和降水数据: GHCND:USC00300331 Aurora NY (2010 and 2015); GHCND:USC00304174 Ithaca/Lansing NY (2010); GHCND:USC00231801 Columbia, MO (2010); GHCND:USW00094870 Champaign-Urbana, IL (2010)。
80%样品中共有的OTUs与2015年气候数据线性模型关联:

lm(OTU_abundance ~ climate_measurement + week + standardized_counts)

2010数据采用混线模型:

lmer(OTU_abundance ~ climate_measurement + week + standardized_counts + (1|environment))

Climate_measurement包括温度和降雨量,OTU相对丰度进行立方根转换。原始数据转换为标准counts再差异比较。气温和降水量等天气检测项目包括当天平均气温、当天降水量、两天累计降水量、三天累计降水量。

遗传力分析

为计算广义遗传力,我们选取样本量大于10000,80%样品中出现的OTUs。OTUs标准化为自身的比例,再对数转换为适合正态分布,使用lme4的混合线性模型拟合:

OTUi ~ sample_depth + week + location + inbred_nested

OTUi是第i个OTU的值,sample_depth样品出现的比例, week时间,
location取样地, 和inbred_nested指每个自交系时间、地点的组合效应。Sample_depth作为固定效应拟合, location和inbred_nested作为随机效应。广义遗传力估计采用inbred_nested的变异与总变异的比例。遗传力无效假设评估采用随机排序OTU值5000次。本研究的所有脚本见 https://github.com/wallacelab/ley_rhizosphere_2017

检测样本大小对遗传力的影响,2010年随机抽样本至2015年样本量,每周5个样本,随机10次,H2值范围 0.329 to 0.464。

变异组成

确定群体结构的变异组成采用线性回归分析主成分结合采样时间和地点。简单的线性模型为

PCi ~ week * location * inbred

PCi是第i个主成分,week是取样时间,location是取样地点,inbred是自交系,*代表组合。变异是每个模型组件解析平方和和残基。

产生80%样品共有的OTUs,并采用可遗传的OTUs标记为红色。一共有753个OTUs,136个显著可遗传。进化树来自greengene全长预构建树,并使用filter_tree.py过滤目标树。物种注释保留最近有名称的级别。采用iTOL在线绘图,并手动按门着色。

高精度的假单孢菌OTUs

选择3个OTUs注释为Pseudomonas,挑先其中的序列按100%计算Bray-Curtis距离。使用filter_fasta.py过滤这几个OTUs对应的序列,再使用100%条件的pick_otus.py挑选OTUs。Beta多样性基于抽样1000条序列的样本,并采用BC距离计算。计算100%相似度假单胞菌年与年间的相关性,选择样本测序量大于>1000条。最高丰度的10个OTUs相关计算采用cor.test()。

核心微生物组的鉴定

见方法16S rRNA基因扩增子序列处理和方析:核心微生物组鉴定采用检测OTUs在所有样品中出现情况,利用QIIME的 compute_core_microbiome.py 脚本计算根际样本中包含至少10000条以上序列的样本进行计算。

其中附表1中列出了核心OTUs采用Greengenes 2013.8物种注释,并检测100%和95%在根际样本中存在的列表。

这里也可以使用usearch11的新功能otutab_core(http://www.drive5.com/usearch/manual/cmd_otutab_core.html)分析,QIIME中compute_core_microbiome.py (http://qiime.org/scripts/compute_core_microbiome.html)也有类似功能。基本思想是统计每个OTUs在各样品中可检测的比例。

序列存储

序列存储于ENA:
2010玉米数据: PRJEB21985
2015部分重复数据: PRJEB21590

Reference

Walters, W. A., Z. Jin, N. Youngblut, J. G. Wallace, J. Sutter, W. Zhang, A. Gonzalez-Pena, J. Peiffer, O. Koren, Q. Shi, R. Knight, T. Glavina Del Rio, S. G. Tringe, E. S. Buckler, J. L. Dangl and R. E. Ley (2018). “Large-scale replicated field study of maize rhizosphere identifies heritable microbes.” Proc Natl Acad Sci U S A 115(28): 7368-7373.

NCBI链接:http://www.ncbi.nlm.nih.gov/pubmed/29941552

PNAS链接:http://www.pnas.org/content/115/28/7368.long

PDF全文:http://www.pnas.org/content/115/28/7368.full.pdf

附录:http://www.pnas.org/content/pnas/suppl/2018/06/20/1800918115.DCSupplemental/pnas.1800918115.sapp.pdf 里面有方法和附图表共16页

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外1800+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存